Zum Hauptinhalt springen

Analyse und Automatisierung von Service Requests

·196 Wörter·1 min
Scikit Learn Clustering KMeans DBScan Explorative Data Analysis (EDA) LLM Streamlit Plotly Maschinelles Lernen Daten Visualisierung Hyperparameter Optimierung Huggingface Text Embedding PCA Klassifizierung Python Azure Cloud Data Scientist Git Confluence Jira

Im Rahmen des Projekts wird die Analyse und Automatisierung von Service Requests durchgeführt. Hierfür werden 3,5 Jahre an Daten aus einem Issue-Tracking-Tool exportiert und untersucht.

Explorative Datenanalyse #

Zunächst wird eine explorative Datenanalyse (EDA) durchgeführt, um ein besseres Verständnis über die Struktur und Verteilung der Daten zu erhalten. Dabei werden grundlegende statistische Kennzahlen berechnet und Visualisierungen erstellt.

Die Texte der Service Requests werden mit dem Huggingface SentenceTransformer in hochdimensionalen Vektoren repräsentiert. Diese Embeddings dienen als Grundlage für das Clustering und die spätere Klassifikation.

Um Muster in den Service Requests zu identifizieren, werden Clustering-Methoden wie k-Means und DBSCAN verwendet. Vor dem Clustering wird eine Dimensionsreduktion mittels Principal Component Analysis (PCA) durchgeführt. Die resultierenden Cluster werden visualisiert, um die Gruppierungen der Anfragen nachvollziehen zu können.

Automatische Klassifikation #

Basierend auf den ermittelten Clustern und den generierten Embeddings werden Modelle zur automatischen Klassifikation der Service Requests erstellt. Dabei kommen verschiedene Machine-Learning-Ansätze zum Einsatz, um Anfragen automatisiert den passenden Kategorien zuzuordnen.

Möchten Sie mehr wissen? Vereinbaren Sie jetzt einen Termin!

Tätigkeiten #

  • Durchführung der Explorativen Daten Analyse (EDA)
  • Generierung von Datenvisualisierungen
  • Berechnung von Clustern mit k-Means und DBSCAN
  • Überführung in den Vector-Space mit Huggingface Transformer-Modellen
  • Klassifizierung mit diversen ML-Modellen (z.B: RandomForest, XGBoost)